基于预训练语言模型的互联网开源信息抽取与情报分析应用研究——以“学术、讲座、论坛”等会议活动为例
王宇琪周庆山
北京大学信息管理系
摘要:[目的/意义]互联网开源信息具有海量、多源异构等特点,如何从中及时发现有价值的信息,并对信息加以情报利用一直是情报研究和实践应用的重点领域之一。本文提出一套开源的学术会议领域信息抽取框架,解决信息抽取语义理解和关联融合的问题,并将其应用于情报研究中,为解决情报分析的智能应用提供工具和方法。[方法/过程]采集网络上新闻报道的内容,采用预训练语言模型方法挖掘学术会议事件信息,提出面向特定领域的信息抽取框架,实现会议名称及其举办时间、地点、出席人物、发言人物信息的抽取,并进行实际的情报利用研究案例分析。[结果/结论]相较于单一抽取实体的方法,抽取会议核心元素更具有情报关联性和准确性,可以更好地对开源热点事件发现和跟踪监测、目标人物轨迹动向分析等研究提供方法,为情报分析应用和情报研判奠定基础。
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用
- 分类号:
TP391.1
中国知网独家网络首发,未经许可,禁止转载、摘编。
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]基于预训练语言模型的互联网开源信息抽取与情报分析应用研究——以“学术、讲座、论坛”等会议活动为例[J]. 王宇琪,周庆山. 情报理论与实践. 2024(01)
- [2]大语言模型在建筑工程中的应用测试与讨论[J]. 覃思中,郑哲,顾燚,陆新征. 工业建筑.
- [3]大语言模型在无锚题等值中的应用——以阅读素养测评为例[J]. 杜君磊,郑勤华,宋义深. 武汉大学学报(理学版).
- [4]基于大语言模型的语料库查询自动生成方法[J]. 张成辉,罗景,涂新辉,陈雨霖. 计算机工程.
- [5]基于译文易错词纠正机制的大语言模型机器翻译[J]. 李博,季佰军,段湘煜. 计算机工程.
- [6]大语言模型的偏见挑战:识别、评估与去偏[J]. 徐月梅,叶宇齐,何雪怡. 计算机应用.
- [7]基于大语言模型和事件融合的电信诈骗事件风险分析[J]. 斯彬洲,孙海春,吴越. 数据分析与知识发现.
- [8]大语言模型赋能“问题与方法”学术图谱构建与应用研究[J]. 刘启刚,王尹凡,牟立峰,徐伟,孙向阳. 数据分析与知识发现.
- [9]基于组合上下文提示的大型语言模型领域知识问答研究[J]. 方全,张金龙,王冰倩,胡骏. 计算机科学.
- [10]融合知识图谱的大语言模型研究综述[J]. 曹荣荣,柳林,于艳东,王海龙. 计算机应用研究.